有效的人类组合需要能够传达团队目标的能力和您需要代理商进行操作的约束。提供指定团队共享意图或操作标准的能力,可以使AI代理执行其主要功能,同时仍然能够满足当前团队的特定愿望。尽管已经开展了重要的工作来指导代理通过语言或演示执行任务,但先前的工作缺乏专注于可以在团队指定的参数中运行的建筑物。更糟糕的是,缺乏有关使人类通过非结构化的自然主义语言提供其规范的研究。在本文中,我们建议将目标和约束用作调节和评估自治药物的脚手架。我们通过介绍一个新颖的数据集和相关的数据收集协议来为这一领域做出贡献,该协议将语言描述映射到与人参与者为棋盘游戏风险开发的特定策略相对应的目标和约束。利用最先进的语言模型和增强程序,我们开发了一个机器学习框架,该框架可用于从非结构化策略描述中识别目标和约束。为了验证我们的方法,我们进行了一项人为主体研究,以建立我们的数据集的人类基础。我们的结果表明,与执行同一机器翻译任务的人类评估者相比,我们的机器学习体系结构能够更好地将非结构化语言描述解释为策略规范(F(1,272.53)= 17.025,p <0.001)。
translated by 谷歌翻译